from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
import json

"""
代玉铃

使用seleniu爬取
中金公司(601995)核心数据

包括：
收益(三):0.392	PE(动):27.10

每股净资产:4.44	市净率:3.18

总营收:84.88亿	同比:-11.22%

净利润:62.09亿	同比:-5.84%

毛利率:61.50%	净利率:73.15%

ROE:9.16%	    负债率:69.37%
"""
url='https://quote.eastmoney.com/sh601995.html'#网页地址

#配置无头信息--预防被封ip
from selenium.webdriver.chrome.options import Options
opt = Options()
opt.add_argument( "--headless")
opt.add_argument ( "--disable-gpu")
web = Chrome(options=opt)

web.get(url)#驱动网页

table=web.find_elements(by=By.XPATH,value='//*[@id="app"]/div/div/div[10]/div[1]/div[3]/div[2]/div/table/tbody/tr/td')[:-6]#去掉末尾6个表格中的无关数据
for td in table:
    txt=td.text#提取文本
    arr=txt.split(':')#提取插入列表
    print(arr)


